Identification Semi-Automatique de Mots-Germes pour l'Analyse de Sentiments et son Intensité
نویسندگان
چکیده
For the purpose of opinion exploring in tweets, this article presents a sentiment classification of tweets content. First, we present a method to identify new sentiment similarity seed words. These seed words are used for predicting sentiment intensity of other words and short phrases in co-occurrence. Then, for testing sentiment similarity, we use: Similarity Measures methods between words and cosine similarity measure between the word embedding representations (e.g. word2vec, GloVE). The experiments results highlight the importance of adapted for tweets seed words. In addition of the corpora size and its pre-treatement. As a conclusion, best results were achieved using cosine similarity measure between the word embedding representations. MOTS-CLÉS : Mots-germes, Twitter, Mesure de la Similarité, Plongement de mot, Word2vec, GloVe.
منابع مشابه
Building and exploiting a French corpus for sentiment analysis (Construction et exploitation d'un corpus français pour l'analyse de sentiment) [in French]
Building and exploiting a French corpus for sentiment analysis This work introduces a French corpus for sentiment analysis. We describe the construction and organization of the corpus. We then apply machine learning techniques to automatically predict whether a text is positive or negative (the opinion classification task). Two techniques are used : logistic regression and classification based ...
متن کاملToward an amazigh language processing
Since antiquity, the Amazigh heritage is expanding from generation to generation. In the aim of safeguarding it from being threatened of disappearance, it seems opportune to equip this language of necessary means to confront the stakes of access to the domain of New Information and Communication Technologies (ICT). In this context, and in the perspective to build tools and linguistic resources ...
متن کاملIdentifier la cible des émotions dans les forums de santé
Résumé : Les forums de santé en ligne sont des espaces d’échanges où les patients partagent leurs sentiments à propos de leur(s) maladie(s), traitement(s), etc. Sous couvert d’anonymat, ils expriment très librement leurs expériences personnelles. Ces forums sont donc une source d’informations très utile pour les professionnels de santé afin de mieux identifier et comprendre les problèmes, les c...
متن کاملConstruction automatique de ressources lexicales pour la fouille d'opinion
RÉSUMÉ. De nombreuses méthodes automatiques de fouille d'opinion s'appuient sur un lexique dans lequel à chaque entrée est associé un degré de polarité. La construction de telles ressources linguistiques est donc devenue un champ de recherche important en linguistique computationnelle. Des techniques automatiques, basées sur les similarités sémantiques entre les mots dont on veut estimer la pol...
متن کاملParole et Traduction Automatique: Le Module de Reconnaissance RAPHAEL
Pour la traduction de parole, il est n6cessaire de disposer d'un syst~me de reconnaissance de la parole spontan6e grand vocabulaire, tournant en temps r6el. Le module RAPHAEL a 6t6 con~u sur la plateforme logicielle de JANUS-III d6velopp6e au laboratoire ISL (Interactive Systems Laboratory) des universit6s Karlsruhe et Carnegie Mellon. Le corpus BREF-80 (textes lus extraits du Journal Le Monde)...
متن کامل